100次AC只有96次Server power failure occurred事件日志问题分析
更新时间: 2026/05/28
在Gitcode上查看源码问题背景
- 单板类型:自研板;
- 软件版本:openUBMC 25.12;
- 涉及功能:AC,日志记录;
- 触发条件:100次AC,每次AC间隔5分钟,查看AC日志记录;
- 业务表现:预期100次Server power failure occurred事件日志;实际96次Server power failure occurred事件日志。
问题复现步骤
自行开发脚本,进行100次AC操作,查看AC事件日志;
关键日志信息
sel.txt文件日志如下:
定位过程
从问题描述可以看出,该问题属于AC过程中的日志记录丢失,sel文件中记录的AC日志信息可知,AC操作100次,实际只保存96次相关记录,观察日志记录时间间隔,两次日志记录事件间隔大概在6至7分钟之间,少数可能超过8分钟甚至达到10分钟,但是记录的时间间隔中存在几次超过10分钟的间隔,脚本测试时AC的时间间隔为10分钟,如果10分钟内日志尚未记录,下一轮AC命令已经下发导致整个系统重启的情况,此时就会存在遗漏日志。针对该问题,可尝试将AC的间隔扩大到15分钟到18分钟,再次进行测试即可。
问题原因
AC操作时间间隔较短,本次的日志尚未记录完成或者上报,下次的AC命令已经下发,导致本次的日志出现丢失的情况,这种问题可以通过将AC时间间隔增大解决;
解决方案
AC操作的时间间隔从10分钟扩大到15分钟甚至18分钟,日志记录就会正常。